# и ее =. 2" и 
ей я У 


`лубокое обуче ‚ 
проду ктовом. 


Илья ИЕ 


| Магн ит 


Как подружить нейросети с 
временными рядами 


Как мы выстроили пайплайн 


Ожидаемый и реальный эффект 


Анализ скрытых представлений 


Гм) | мАСМ 0 


О бизнесе 74) МАГНИТ 


6 >25К 2-25к >150 к 


форматов магазинов КИ в 5КУ всего 
ассортименте 


*по данным на ноябрь 2022 г. 


Гм) | мАСм 0 


продажи 


О задаче 


Формирование прогноза спроса для каждой комбинации магазин-товар-день 
Горизонт прогноза нефиксированный: от 1 дня до 1 года 


(®) Плечо прогнозирования является нефиксированным и составляет - 30-180 дней 


Гм) | мАСм 0 


Классический стек уже реализован 


Отсутствие возможности полноценно учитывать происходящее до и после целевого периода 


Наличие большого количества моделей в текущих подходах 


| 
Палин | к пи 


Базовые Кастомные Бустинги Нейросети 
подходы алгоритмы 


Гм) | мАСм 0 


Вклад от 
развития 
модели 


Неважно, что обучать - 
важно, чем кормить 


Типичные данные 


Пропуски во р 
Аномалии Виртуальные Искаженный 
временных рядах 


остатки спрос 


Обнуления Искаженный спрос Виртуальный остаток 


^——. 


Пропуски Временное закрытие Промо Аномалии 


Гм) | мАСм 0 


Более 50 млрд 
наблюдений за 1 год 


ММ и нте зепез$ 


Отсутствие популярности 
у нейросетей для табличных 
данных 


Малое количество 
общедоступной 
экспертизы 


Гм) | мАСм 0 


{Пе п1о${ роршаг пеига! пемиогк5 


-] Картинки 


езультатов: примерно 348 000 000 (0,46 сек. 


Тор 10 Меига! Меммогк АгснКес{игез п 2022 МЕ Епонлеег$ Меед {о Геагп 


» [0№615 
Бап Стезап Ме. 
АехМеЕ 
О\уеПеа{ 
УСС. 
Меймогк-т-пеггогк 
СоочЕеМе! апд 1псершоп 
Вошепеск [ауег 


Ещё 


Пр: Илии орогая. сот › В0д › АИС 1тешоепсе 


Тор 10 Мега! Мемогк Агсийесиге$ т 2022 МЕ Епдтеег$ ... 


Инструменты 


Дороговизна 


Большая требовательность 
к подготовке данных 


Экстраполяция 


Черный ящик для бизнеса 


Более низкие метрики 


Базовые элементы 


Гм) | мАСМ 0 


Для работы с последовательностями 


[прчт$ Ошрч+ 


Маскирование 


Преимущества: 
Е Отсутствие фиктивных 
а значений 
Обнуления Искаженный спрос Виртуальный остаток 
———х хххххххххххх хх и 
Пропуски Временное закрытие Промо Аномалии г 
х х 
Хх х 
ххх 


[У | МАСМ 12 


Маскирование 


Преимущества: 


1 


|прит$ 


Гм) | мАСм 0 


Цельный 
временной ряд 


Отсутствие фиктивных 
значений 


Ош рит 


Неизвестные факторы 


Наблюдения 


Гм) | мАСм 0 


Признаки 


ры 
к а 


Дата расчета 


0% 4 
0% 2 
0% 3 
10% 7 


ауд 


В случае работы 


в скалярном формате 


одно наблюдение - 
это одна строка 


Неизвестные факторы 


Температу 


Будущее 


Прошлое =5 


Гм) | мАСм 0 


В случае работы 

с последовательностями 
одно наблюдение - 

это одна таблица 


Неизвестные факторы 


($ТМ ($ТМ 
Епсоаег Ресоаег 


| | 


Раз+ при{$ Кпомип Ритиге при{т$ 


и 


приз Ош ри" 


Гм) | мАСМ 0 


Статичные признаки 


Будущее 


Прошлое 


Гм) | мАСм 0 


Торговая 
площадь 


0% 


20% 
0% 
10% 


Дата расчета 


0% 
0% 
0% 


10% 


Преимущества: 


Корректное использование 
статичных признаков 


Оптимизация используемой 
памяти 


Статичные признаки 


($ТМ 
Ресоаег 


= сз 


тайс ака Раз при{$ Кпомип Еииге прит$ 
|пру{$ Ощри 


Гм) | маем в 


ЕтБеаата$ 


Преимущества: 


. Минимизация фиче-инжиниринга . Работа с высокоразмерными кат. фичами 


[при 
ЕпсоЧтоа Оепзе 
\уестог 


( 

1 0.3 Оеер {еагпт9 
(е 

Саеаогса| о ЕтЬедат 
Ч Ч 0.9 Моае| 
Теафиге$ о по4е! 
— 0.0 
( 


Гм) | мАСм 0 


Категориальные факторы 


ЕтБедата 
то4е| 


Бас аата 


Гм) | мАСм 0 


($ТМ 
Епсоаег 


Раз шрит$ 


|пруи{$ 


($ТМ 
Ресоаег 


Етрбедата 
поае| 


Кпомит Ритиге при $ 


Е$ТМ 


Оцрит 
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\УанаЫе ЗеесНоп Ме!умогК 


В В 5 44 Мот 


Везча|! 


СоппесНоп т 
Зато! 
ПЕ Е вым шру+ Ех+егпа| 
(А) Сотех+ 
Сатеа Иптеаг ЦпН (СИ) Сатеа Резача! Ме1\иогК (СВМ) 


СЕУ помогает в выборе наиболее 


Помогает сети понять, какие входные 
важных признаков 


преобразования просты, а какие требуют 
более сложного моделирования 


Гм) | мАСм 0 


ЗоНтах 


ТгапогтеЯ РаНепеЯ — Ежегпа| 
пиру! $ пиру! $ Соптех+ 


УапаЫе ЗеесНоп МеТ\иогк (У$М) 


Представляет собой механизм выбора 
признаков и позволяет различать 
полезные факторы от зашумленных, 
используя для этого СУ и СКМ 
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($ТМ ($ТМ 
Епсо4ег Оесо4ег 


УапаЫе УамаЫе УамаЫе 
ЗеесНоп ЗеесНоп ЗеесНоп 


+411 
ЕтБеаата 
о4е| 


ЕтБеаата 
оае| 


4 4 


Зфайс аата Раз при{$ Кпомт Рииге при! $ 


1при{$ Ошри{ 


[У | МАСМ 22 


Араспе 


АпПом/ 


Бата ргосеззта 
Тгатла «Я 
ЕЁТ 


н ПАЛОТА 
ланировали А ее Теза \100 
доскег 
Оерюу 


Бата ргосеззта 


пегепсе «>Я 
ЕЁТ 
| ПАЛОТА 
А 4 Теа У100 


Гм) | МАСМ - 


Пм) | масм 


Реализовали 


Бата 
ргосеззта 


АРАСНЕ 


ЕТ 5ра 


р 


Араспе 


АптПом/ 


а 


Тгатила 
ЕЁТ < 


ПАЛОТА 
А &> Теча А1ОО х8 


доскег 


Оерюу 


ш!егепсе 


ЕТ 
ПА\ЛОТА 
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5ип(аЬ$ (продажи _ прогноз))) 


Ошибка = 
5ит(продажи) 


Точность = 1 — Ошибка 


+4-6 пп +1.5 пп 123 


в ретро в проде ВО! 


Гм) | МАСМ 


Анализ скрытых представлений 


\УМотап 


Г) | маем % 


Временные периоды 


Кластеризация месяцев 


янв фев мар апр май июн июл авг сен окт ноя дек 


[У | МАСМ 27 


Временные периоды 


Кластеризация дней недели 


пн вт ср чт пт сб вс 


Гм) | мАСМ 0 


Кластеризация магазинов 


> 
` 
= 
о 
Е 
Ф 
„б 
[ее 
о 
|. 
О. 
\®, 
= 
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Гм) | мАСМ (9 


Кластеризация магазинов в курортном регионе 


30 


Ассортимент 


Ближайшие товары к «РЕР$! Со[а 1л»: 


СОСА-СОГА Напиток сил/газ 0,9л 

РЕР$! Со[а Напиток сил/газ 2л 

РЕР$! Со[а Напиток сил/газ 1,5л 
СОСА-СОГА Напиток газированный 1,5л 


СОСА-СОТГА Напиток газированный 2л 


31 


Ассортимент 


Ближайшие товары к «ОХОТА Крепкое» 


БАЛТИКА №9 Пиво Легенд Свет фильт паст 8% 0,45л 
ГОМ/ИЕМОКАЧ Пиво свет паст ориг 5,4% 0,45л 

КАМА Пиво свет фильтр паст 8% 0,45л 
ЖИГУЛЕВСКОЕ Пиво свет фильтр непаст 0,5л 
ЩЕРБАКОВСКОЕ Пиво свет непаст 7% 1,5л 


Гм) | мАСм 0 


7. 


РИКИ ке У 
Нейросети работают с временными ДС Я ею. а 
рядами Р УХ и. ХА у Ри 8 . т 7 с ь х | | 
а ых : ДЕ Е . \ ы 7 ДУ ь * 


Это рентабельно 


Качество данных важнее всего 


Лучше начать с классического стека 


Читайте нас 
на На! 


Гм) | МАСМ (9 


Обратная связь ^ 
‘по докладу | 


| 


